Paper Title
作者信息
链接:
摘要:
总结概括
Introduction
1. 先前工作存在的问题概述
2. 难点
3. 补充背景
Motivation
Design
Evaluation
思考角度
我如何做这个问题
这个洞见可以引申出其他其他方法吗
该洞见是否可以迁移到其他领域中
该工作有什么可能可以改进的地方
Q&A
论文笔记:DejaVu、LLM in Flash、PowerInfer - 知乎
聊聊大模型推理的动态稀疏化之二:MInference1 与 PowerInfer2 - 知乎
“改了模型,同时在 benchmark 上引入了相当显著的损失。”
“当前主流大模型结构基本都是源于 llama,并不是使用 RELU,没法直接使用这个框架。”